1.1 Objetivo general: tratamiento computacional de LSE
Al mismo tiempo que aumenta la visibilidad de las lenguas de signos, estas se están convirtiendo en un foco de atención en el ámbito de la Inteligencia Artificial (IA), especialmente en el contexto de nuevos paradigmas como el Aprendizaje Profundo (Deep Learning) y la Analítica de Datos Masivos (Big Data). Dada su naturaleza intrínsecamente multimodal y su potencial para mejorar la accesibilidad de las personas con discapacidades auditivas, las lenguas de signos ofrecen un campo de estudio especialmente atractivo para los investigadores en IA, quienes buscan desarrollar algoritmos y sistemas que puedan tratar estas lenguas de manera automática y eficaz.
Además del innegable atractivo que representan las Lenguas de Signos (LS) para las tecnologías computacionales emergentes, es imperativo reconocerlas como lenguajes naturales que son susceptibles de análisis en el ámbito de la lingüística computacional (LC) y el procesamiento del lenguaje natural (PLN). La LC se encarga del estudio de las lenguas y la facultad humana del lenguaje a través de métodos computacionales, incluyendo pero no limitado a la lógica formal y las matemáticas. En contraposición, el PLN se centra en el tratamiento de la lengua humana desde la perspectiva de la ingeniería informática, ya sea como datos de entrada, salida o para procesos de análisis y síntesis del lenguaje.
Este trabajo se inserta en la intersección disciplinar entre informática y lingüística, ámbito en el que he focalizado mi investigación. En este sentido, el objetivo principal de la presente tesis es explorar y avanzar en el tratamiento computacional de las lenguas de signos, específicamente la Lengua de Signos Española (LSE), usando técnicas modernas de IA, LC y PLN.
Cuando se contempla la posibilidad de tratar computacionalmente las LS, las primeras ideas que suelen surgir son la generación de avatares signantes o el reconocimiento automático de la LS (Elliott et al. 2008; Lombardo et al. 2011; Ludeña 2014). Estos son igualmente los puntos de partida con los que inicié mi propia investigación académica y son comúnmente propuestos por estudiantes para sus trabajos de fin de grado o máster (Sánchez Jiménez, López Prieto, y Garrido Montoya 2019; Vegas Cañas, Rodríguez Cuesta, y Torralbo Fuentes 2020), así como en enfoques empresariales que abordan esta temática. Mi trayectoria inicial también se centró en abordar estos problemas, a través del diseño de avatares animados y la utilización de cámaras de video y de profundidad para el reconocimiento de signos.
No obstante, se debe subrayar que tanto la creación de avatares como el reconocimiento automático son tareas de gran envergadura que no admiten una aplicación directa de tecnologías preexistentes. Esta complejidad se torna evidente al considerar las LS como lenguas en pleno derecho. Crear un avatar animado que signe de manera natural es un problema computacional comparable a desarrollar un software que pueda hablar en una lengua oral de forma natural. Del mismo modo, el reconocimiento automático de la LS representa un reto en el campo de la traducción automática. El estado del arte en traducción automática ha alcanzado niveles de sofisticación considerables, pero esto se ha logrado tras años de investigaciones dedicadas y la asignación de recursos significativos.